朴素贝叶斯分类模型的改进研究

朴素贝叶斯分类模型的改进研究

作者:师大云端图书馆 时间:2020-01-23 分类:硕士论文 喜欢:3067
师大云端图书馆

【摘要】分类是数据挖掘中的一个重要课题。分类的目的是为了构造出一个分类函数或者分类模型,这个模型可以将数据库中对应的数据项映射到一个给定的类。数据挖掘的分类一般用在提取描述重要数据类的模型或者预测未来数据趋势。朴素贝叶斯分类模型是当前分类算法的研究热点之一,它具有结构不复杂、分类精度高和速度快等优点。运用该模型进行分类的原理是利用训练集构造出一个分类模型,如果训练集中有存在噪声实例,那么它会降低分类器的性能。本文以优化训练集为研究内容,探讨了基于单属性有效度和结合双属性有效度的朴素贝叶斯分类改进模型,通过自定义的单属性有效度和双属性有效度淘汰数据集中的噪声样本,从而实现训练集优化,提高分类准确率的目标。本文主要工作如下:1、介绍了贝叶斯分类的基本理论和朴素贝叶斯分类模型。2、对几种常用的改进朴素贝叶斯分类模型进行分析:树扩展型贝叶斯分类模型、半朴素贝叶斯分类模型、贝叶斯信念网络分类模型。3、在使用训练集构建分类器前,基于贝叶斯理论的思想,以单属性为研究对象,通过自定义的单属性有效度淘汰训练集中的噪声实例,实现训练集的优化。4、在基于单属性有效度的改进模型的前提上,结合双属性有效度,发现和淘汰训练集中存在的更多噪声样本,进一步优化训练集。基于大规模数据及大量的实验结果表明:本文提出的改进方法是可行的,而且能有效的提高分类的准确率。
【作者】朱晓丹;
【导师】董槐林;
【作者基本信息】厦门大学,计算机软件与理论,2014,硕士
【关键词】朴素贝叶斯分类模型;单属性有效度;双属性有效度;

【参考文献】
[1]颜冬润.中风病急性期四诊信息与神经功能评价指标的动态观测[D].北京中医药大学,2004.
[2]焦贝贝.初中英语课本对学生语用能力培养的研究[D].河北师范大学,外国语言学及应用语言学,2013,硕士.
[3]潘伟.绝对连续测度的框架谱性质[D].华中师范大学,应用数学,2013,硕士.
[4]朱民望.冷冻储藏和反复解冻对鸡肉品质的影响研究[D].新疆农业大学,食品科学,2012,硕士.
[5]孙泉.配电网合解环分析及其判断条件[D].西安科技大学,电力系统及其自动化,2013,硕士.
[6]张亮.基于OLAP技术的业务流程多维数据模型分析[D].北京交通大学,2012.
[7]石竹芳.探析奥巴马政府的中东政策:战略调整和战略意图[D].外交学院,英语语言文学,2014,硕士.
[8]卜红丽.临洮县高级中学健美操教学现状调查分析[D].西北师范大学,体育教学,2014,硕士.
[9]苗兴军.发展金属再生科研具有重要意义[J].金属再生.1988(01)
[10]邢海涛.大学英语四级作文自动生成技术研究[D].哈尔滨工业大学,计算机科学与技术,2014,硕士.
[11]郭战涛.YTG50矿用自卸车制动系统优化设计[D].长安大学,机械工程(专业学位),2013,硕士.
[12]王璐,雷耘,张明理.基于序列trnL-trnF和ITS的榉属系统发育与地理分布格局的初步分析[J].植物生态学报,2013,05:407-414.
[13]李高陵.脊柱腰段断层解剖及CT、MR影像对照研究[D].山西医科大学,骨科学,2002,硕士.
[14]张正龙.自组织系统原理在企业人力资源管理过程中的应用[D].上海海运学院,2001.
[15]胡荣希.新加坡:“花园城市”之国[J].长江建设.2002(04)
[16]田璐璐.网络消费者权益保护的法律问题研究[D].山东财经大学,民商法学,2013,硕士.
[17]郭世飞.影像媒体视听语言的实验性与文化阐释[D].大连工业大学,设计艺术学,2009,硕士.
[18]李国芹.具有非线性项的广义Novikov方程的孤子解[D].宁波大学,基础数学,2014,硕士.
[19]宗晓明.球墨铸铁消失模铸造振动凝固组织特征研究[D].华中科技大学,材料加工工程,2013,硕士.
[20]周沂麟,蔡锐彬.转炉煤气自动分析回收装置在我厂的应用[J].冶金自动化,1993,05:54-55.
[21]李金梦,叶旭君,王巧男,张初,何勇.高光谱成像技术的柑橘植株叶片含氮量预测模型[J].光谱学与光谱分析,2014,01:212-216.
[22]刘旭旭.我国情报学研究的发展状况[J].情报理论与实践,2005,06:20-23.
[23]刘连连.304不锈钢双辊铸轧过程数值模拟及激光表面强化[D].燕山大学,材料学,2013,硕士.
[24]薛璐.IC制造业的敏捷供应链优化设计及实施研究[D].复旦大学,项目管理,2012,硕士.
[25]胡宁波.基于CAE分析的压铸模具失效区域预测及仿生强化技术研究[D].太原科技大学,机械工程,2014,硕士.
[26]荣攀.基于TD-SCDMA&GSM综测仪的终端快速功率校准的研究与实现[D].中国地质大学(北京),电子与通信工程,2013,硕士.
[27]张新明.基于集群技术的作业管理系统通讯机制的研究与实现[D].西北工业大学,计算机软件与理论,2004,硕士.
[28]朱乐君.GPON系统用户终端的研究与电路设计[D].浙江工业大学,2008.
[29]牛凤霞.三峡水库香溪河库湾内源磷负荷研究[D].三峡大学,水利水电工程,2013,硕士.
[30]张晶晶.2型糖尿病大血管并发症中血浆微小RNA表达谱的研究[D].华中科技大学,内科,2013,硕士.
[31]刘向洋.分别掺加Ag_2O、B_2O_3以及B_2O_3是否预烧对ZnO系压敏电阻性能的影响[D].中原工学院,材料学,2012,硕士.
[32]张铭鑫.2012年奥运会男篮四强赛挡拆运用的研究[D].北京体育大学,体育教育训练学,2013,硕士.
[33]伊志强.移动城域网宽带接入技术应用场景研究[D].南京邮电大学,电子与通信工程(专业学位),2012,硕士.
[34]陶再飞.部分Co基三元系合金相平衡的热力学优化与计算[D].厦门大学,材料工程,2014,硕士.
[35]AsimAhmedIbrahim.Factors Affecting Saudi Arabian Small Scale Business Enterprenuers Doing Business in China[D].苏州大学,INTERNATIONALBUSINESS(专业学位),2014,硕士.
[36]但卫华.“高档猪革产品的综合开发”项目推广应用可行性研究报告[J].中国皮革.1994(06)
[37]张加军.论体育教学艺术[D].安徽师范大学,体育教育训练学,2004,硕士.
[38]陈继文.旁路节流调速系统负载变化对液压缸压力的影响[D].湖南农业大学,农业机械化工程,2004,硕士.
[39]刘璐.谈韩国高中教材“把”字句的编排问题[D].辽宁大学,汉语国际教育,2012,硕士.
[40]记者华凌.石墨烯可作为人工光合作用高效催化剂[N].科技日报,2012-07-19001.
[41]侯凯,李伟邦,范镇淇,骆健,赵晓冬.基于有源电压控制法和无源缓冲法的IGBT串联均压技术[J].电力系统自动化,2013,19:116-121.
[42]齐维贵,丁宝.预加水成球控制系统控制策略分析[J].控制与决策,1997,02:146-149.
[43]王静.国际商事瑕疵仲裁协议的效力认定[D].山东大学,法律(专业学位),2013,硕士.
[44]张国华.工程图形考试自动评判系统的研究与开发[D].中国农业大学,计算机应用技术,2004,硕士.
[45]高娜.锡基复合负极材料的制备及性能研究[D].大连海事大学,2013.
[46]熊令.基于城乡客运一体化的客运站平面布置研究[D].长安大学,交通运输规划与管理,2014,硕士.
[47]陈微微,陈芳.基于“循环互动”模型的高校文科类专业实践教学体系构建[J].教育理论与实践,2012,18:9-11.
[48]王圣.我国金融消费者保护法律制度研究[D].首都经济贸易大学,经济法,2014,硕士.
[49]桑琪.电影《失恋33天》与《钢的琴》营销策略比较研究[D].西南大学,电影学,2013,硕士.
[50]文卫华,战琦.原创文化节目的坚守与创新[J].中国电视,2014,08:12-15.

相关推荐
更多